Точность программы составила 97,5%.
Петр I писал много, неразборчиво, используя сокращения и иностранные слова, поэтому в любое время — хоть в царской России, хоть в СССР, не более 10 специалистов во всей стране могли корректно разобрать и интерпретировать его почерк.
Совсем недавно возникла идея помочь специалистам ускорить работу над петровским архивом с помощью современных технологий. В проекте приняли участие ученые из Санкт-Петербургского Института истории РАН и Высшей школы экономики. К ним под эгидой Российского исторического общества подключился СБЕР — лидер в области искусственного интеллекта. Идея состояла в том, чтобы научить компьютер распознавать почерк Петра I.
Разработчики СБЕРа, работающие в области ИИ, написали базовую программу. Для этого им пришлось проанализировать в специальной программе 9 тысяч строк петровских документов, распознанных ранее.
Для усовершенствования базовой программы, разработанной в СБЕРе, был проведен Хакатон — конкурс программистов, в котором могли принять участие и другие разработчики. Перед участниками состязания стояла непростая задача. На конференции показали слайд с примерами расшифровки надстрочных знаков и примерами написания отдельных слов.
Победители конкурса, представили программу, точность распознавания петровских текстов которой составила 97,5%.
Если дальше работа по изданию рукописного наследия Петра I пойдет такими же темпами, как она шла до сих пор, то можно рассчитывать на завершение проекта примерно через 150 лет - к 500-летию Петра Великого.